ההימצאות (או שכיחות) (prevalence) של תכונה שווה. ההארעות (incidence) של תכונה שווה לפרופורציית נתון. = 645/72, או 89 לכל 10,000 אחיות.

Σχετικά έγγραφα
התפלגות χ: Analyze. Non parametric test

ניהול תמיכה מערכות שלבים: DFfactor=a-1 DFt=an-1 DFeror=a(n-1) (סכום _ הנתונים ( (מספר _ חזרות ( (מספר _ רמות ( (סכום _ ריבועי _ כל _ הנתונים (

לדוגמה: במפורט: x C. ,a,7 ו- 13. כלומר בקיצור

פתרון תרגיל מרחבים וקטורים. x = s t ולכן. ur uur נסמן, ur uur לכן U הוא. ur uur. ur uur

= 2. + sin(240 ) = = 3 ( tan(α) = 5 2 = sin(α) = sin(α) = 5. os(α) = + c ot(α) = π)) sin( 60 ) sin( 60 ) sin(

- הסקה סטטיסטית - מושגים

פתרון תרגיל 8. מרחבים וקטורים פרישה, תלות \ אי-תלות לינארית, בסיס ומימד ... ( ) ( ) ( ) = L. uuruuruur. { v,v,v ( ) ( ) ( ) ( )

פתרון תרגיל 5 מבוא ללוגיקה ותורת הקבוצות, סתיו תשע"ד

חורף תש''ע פתרון בחינה סופית מועד א'

יסודות לוגיקה ותורת הקבוצות למערכות מידע (סמסטר ב 2012)

שדות תזכורת: פולינום ממעלה 2 או 3 מעל שדה הוא פריק אם ורק אם יש לו שורש בשדה. שקיימים 5 מספרים שלמים שונים , ראשוני. שעבורם

תרגיל 13 משפטי רול ולגראנז הערות

שאלה 1 V AB פתרון AB 30 R3 20 R

תרגול פעולות מומצאות 3

הסקה סטטיסטית/תקציר/תלמה לויתן

x = r m r f y = r i r f

gcd 24,15 = 3 3 =

Charles Augustin COULOMB ( ) קולון חוק = K F E המרחק סטט-קולון.

צעד ראשון להצטיינות מבוא: קבוצות מיוחדות של מספרים ממשיים

ל הזכויות שמורות לדפנה וסטרייך

[ ] Observability, Controllability תרגול 6. ( t) t t קונטרולבילית H למימדים!!) והאובז' דוגמא: x. נשתמש בעובדה ש ) SS rank( S) = rank( עבור מטריצה m

תשובות מלאות לבחינת הבגרות במתמטיקה מועד ג' תשע"ד, מיום 0/8/0610 שאלונים: 315, מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן

תרגול 1 חזרה טורי פורייה והתמרות אינטגרליות חורף תשע"ב זהויות טריגונומטריות

לוגיקה ותורת הקבוצות פתרון תרגיל בית 8 חורף תשע"ו ( ) ... חלק ראשון: שאלות שאינן להגשה נפריד למקרים:

תרגול מס' 6 פתרון מערכת משוואות ליניארית

מבחן t לשני מדגמים בלתי תלויים. T test for independent samples

גבול ורציפות של פונקציה סקלרית שאלות נוספות

מתכנס בהחלט אם n n=1 a. k=m. k=m a k n n שקטן מאפסילון. אם קח, ניקח את ה- N שאנחנו. sin 2n מתכנס משום ש- n=1 n. ( 1) n 1

סיכום בנושא של דיפרנציאביליות ונגזרות כיווניות

דף פתרונות 7 נושא: תחשיב הפסוקים: צורה דיסיונקטיבית נורמלית, מערכת קשרים שלמה, עקביות

סיכום- בעיות מינימוםמקסימום - שאלון 806

אלגברה מודרנית פתרון שיעורי בית 6

קבוצה היא שם כללי לתיאור אוסף כלשהו של איברים.

I. גבולות. x 0. מתקיים L < ε. lim אם ורק אם. ( x) = 1. lim = 1. lim. x x ( ) הפונקציה נגזרות Δ 0. x Δx

א הקיטסי ' טטסל אובמ רלדנ הינור בג '

קיום ויחידות פתרונות למשוואות דיפרנציאליות

תרגיל 7 פונקציות טריגונומטריות הערות

לוגיקה ותורת הקבוצות פתרון תרגיל בית 4 אביב תשע"ו (2016)

PDF created with pdffactory trial version

c ארזים 26 בינואר משפט ברנסייד פתירה. Cl (z) = G / Cent (z) = q b r 2 הצגות ממשיות V = V 0 R C אזי מקבלים הצגה מרוכבת G GL R (V 0 ) GL C (V )

{ : Halts on every input}

משוואות רקורסיביות רקורסיה זו משוואה או אי שוויון אשר מתארת פונקציה בעזרת ערכי הפונקציה על ארגומנטים קטנים. למשל: יונתן יניב, דוד וייץ

הרצאה. α α פלוני, וכדומה. הזוויות α ל- β שווה ל-

פתרונות , כך שאי השוויון המבוקש הוא ברור מאליו ולכן גם קודמו תקף ובכך מוכחת המונוטוניות העולה של הסדרה הנתונה.

s ק"מ קמ"ש מ - A A מ - מ - 5 p vp v=

גמישויות. x p Δ p x נקודתית. 1,1

אלגברה ליניארית (1) - תרגיל 6

סדרות - תרגילים הכנה לבגרות 5 יח"ל

שאלה 5: להלן סטטיסטיקה תיאורית מפורטת עם טבלת שכיחות לציוני בית ספר לוח 1: סטטיסטיקה תיאורית של ציוני בית ספר

בסל A רמת התועלת היא: ) - השקה: שיפוע קו תקציב=שיפוע עקומת אדישות. P x P y. U y P y A: 10>6 B: 9>7 A: 5>3 B: 4>3 C: 3=3 C: 8=8 תנאי שני : מגבלת התקציב

סיכום חקירת משוואות מהמעלה הראשונה ומהמעלה השנייה פרק זה הינו חלק מסיכום כולל לשאלון 005 שנכתב על-ידי מאיר בכור

(ספר לימוד שאלון )

ןמנירג ןואל \ הקיטסיטטס הקיטסיטטסב הרזח ה יפד ךותמ 14 דו 1 מע

f ( x, y) 1 5y axy x xy ye dxdy לדוגמה: axy + + = a ay e 3 2 a e a y ( ) במישור. xy ואז dxdy למישור.xy שבסיסם dxdy וגבהם y) f( x, איור 25.

החשמלי השדה הקדמה: (אדום) הוא גוף הטעון במטען q, כאשר גוף B, נכנס אל תוך התחום בו השדה משפיע, השדה מפעיל עליו כוח.

1 תוחלת מותנה. c ארזים 3 במאי G מדיד לפי Y.1 E (X1 A ) = E (Y 1 A )

brookal/logic.html לוגיקה מתמטית תרגיל אלון ברוק

הגדרה: מצבים k -בני-הפרדה

תשובות מלאות לבחינת הבגרות במתמטיקה מועד חורף תשע"א, מיום 31/1/2011 שאלון: מוצע על ידי בית הספר לבגרות ולפסיכומטרי של אבירם פלדמן.

לוגיקה ותורת הקבוצות מבחן סופי אביב תשע"ב (2012) דפי עזר

( )( ) ( ) f : B C היא פונקציה חח"ע ועל מכיוון שהיא מוגדרת ע"י. מכיוון ש f היא פונקציהאז )) 2 ( ( = ) ( ( )) היא פונקציה חח"ע אז ועל פי הגדרת

x a x n D f (iii) x n a ,Cauchy

Prerequisites for the MBA course: Statistics for managers".

Έλεγχος ανεξαρτησίας μεταξύ δύο ποιοτικών μεταβλητών (Crosstabs - Chi-Square Tests)

מתמטיקה בדידה תרגול מס' 2

אקונומטריקה ד"ר חמי גוטליבובסקי סמסטר א' תש "ע

The No Arbitrage Theorem for Factor Models ג'רמי שיף - המחלקה למתמטיקה, אוניברסיטת בר-אילן

מתמטיקה בדידה תרגול מס' 5

תרגילים באמצעות Q. תרגיל 2 CD,BF,AE הם גבהים במשולש .ABC הקטעים. ABC D נמצאת על המעגל בין A ל- C כך ש-. AD BF ABC FME

"קשר-חם" : לקידום שיפור וריענון החינוך המתמטי

טושפ הרעשה ןחבמ t ןחבמ

תורת הקבוצות תרגיל בית 2 פתרונות

מתמטיקה בדידה תרגול מס' 13

לוגיקה ותורת הקבוצות מבחן סופי אביב תשע"ד (2014) דפי עזר

מצולעים מצולעהוא צורה דו ממדית,עשויה קו"שבור"סגור. לדוגמה: משולש, מרובע, מחומש, משושה וכו'. לדוגמה:בסרטוט שלפappleיכם EC אלכסוןבמצולע.

קבל מורכב משני מוליכים, אשר אינם במגע אחד עם השני, בכל צורה שהיא. כאשר קבל טעון, על כל "לוח" יש את אותה כמות מטען, אך הסימנים הם הפוכים.

בס"ד פאניה - PANYA חוברת סטטיסטיקה ב' קורס סטטיסטיקה ב' למדעי החברה כתבה: ענבל יולזרי החישובי, כולל הדוגמאות המובאות בו, של

אלגברה ליניארית 1 א' פתרון 2

הרצאה 7: CTMC הסתברויות גבוליות, הפיכות בזמן, תהליכי לידה ומוות

ΠΕΡΙΓΡΑΦΙΚΗ και ΕΠΑΓΩΓΙΚΗ ΣΤΑΤΙΣΤΙΚΗ

תורת ההסתברות 1 יובל קפלן סיכום הרצאות פרופ יורי קיפר בקורס "תורת ההסתברות 1" (80420) באוניברסיטה העברית,

אלגברה ליניארית 1 א' פתרון 7

* p <.05. ** p <.01. *** p <.001 o

פתרון תרגיל 6 ממשוואות למבנים אלגברה למדעי ההוראה.

סטודנטים יקרים. לפניכם ספר תרגילים בקורס הסקה סטטיסטית. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.

קורס: מבוא למיקרו כלכלה שיעור מס. 17 נושא: גמישויות מיוחדות ושיווי משקל בשוק למוצר יחיד

למידה חישובית אלי דיין 1.

3-9 - a < x < a, a < x < a

"שקר". במקום המילים "אמת" או "שקר" משתמשים באותיות T ו- F (באנגלית truth אמת, false שקר (

Logic and Set Theory for Comp. Sci.

תרגול משפט הדיברגנץ. D תחום חסום וסגור בעל שפה חלקה למדי D, ותהי F פו' וקטורית :F, R n R n אזי: נוסחת גרין I: הוכחה: F = u v כאשר u פו' סקלרית:

. {e M: x e} מתקיים = 1 x X Y

םיאלמ תונורתפ 20,19,18,17,16 םינחבמל 1 להי רחש ןולאש הקיטמתמב סוקופ

אלגברה לינארית (1) - פתרון תרגיל 11

מתמטיקה בדידה תרגול מס' 12

לדוגמא : dy dx. xdx = x. cos 1. cos. x dx 2. dx = 2xdx לסיכום: 5 sin 5 1 = + ( ) הוכחה: [ ] ( ) ( )

פתרון תרגיל בית 6 מבוא לתורת החבורות סמסטר א תשע ז

דיאגמת פאזת ברזל פחמן

{ } { } { A חוקי דה-מורגן: הגדרה הסתברות מותנית P P P. נוסחת בייס ) :(Bayes P P נוסחת ההסתברות הכוללת:

שטף בהקשר של שדה וקטורי הוא "כמות" השדה הוקטורי העובר דרך משטח מסויים. שטף חשמלי מוגדר כך:

Transcript:

שיעורים ופרופורציות הפרופורציה של תופעה שווה למספר האנשים שהם בעלי אותה תכונה מחולק במספר האנשים הנחקרים. ההימצאות (או שכיחות) (prevalence) של תכונה שווה לפרופורציית האנשים באוכלוסייה שהם בעלי אותה תכונה. ההארעות (incidence) של תכונה שווה לפרופורציית האנשים באוכלוסייה הרוכשים את התכונה במשך חלון זמן נתון. המונח שיעור (rate) של תכונה יכול להתייחס לפרופורצייה, להימצאות או להארעות, בהתאם להקשר. דוגמה: במחקר של מנסון ושותפים על הקשר בין הליכה ומחלות לב אצל נשים, במהלך 8 שנים של מעקב, חלו 645 ממחלות לב. האם זה הרבה או מעט? השתתפו במעקב. כדי לענות, חשוב לדעת כמה אחיות המחקר כלל 7,488 אחיות. לכן השיעור של מחלות לב הוא = 645/7,488 0.0089 או 89 לכל 10,000 אחיות. נהוג להציג הארעות ביחס לתקופת זמן סטנדרטי. במקרה זה, נראה מתאים לחשב את ההארעות על בסיס שנתי. השיעור השנתי של מחלות לב אצל האחיות הוא 8/(645/7,488) = 0.0011, או 11 מקרים לכל 10,000 אחיות כל שנה. השואה בין שיעורים. מטרה נפוצה היא להשוות בין שיעורים או פרופורציות. בניסויים קליניים, כמובן, רוצים לבדוק האם הטיפול הנסיוני משפר את שיעור ההחלמה לעומת טיפול סטנדרטי. במחקרים אפידימיולוגיים, מחפשים גורמים הקשורים לשיעורי תמותה או תחלואה. גורמים כאלה נקראים גורמי סיכון factors).(risk למשל, במחקר על הליכה אצל האחיות, השאלה המרכזית היתה האם הליכה מקטינה את השיעור של מחלות לב. במחקר על אפיון גנטי וקרישי דם, קשורה להופעה של קרישים. השאלה היתה האם נוכחות הגן

במחקרים על גורמי סיכון, יש שלושה מדדים מקובלים לצורך השוואה בין השיעורים של מחלה. נתבונן בשתי קבוצות, עם שיעורים p 1 ן- p, בהתאמה. שני מדדים נפוצים להשוות ביניהם הם: הסיכון המוחלט =.p 1 -p בלועזית,. absolute risk הסיכון היחסי =.p 1 /p בלועזית,.relative risk המדד השימושי ביותר תלוי במטרות ובהשלכות של המחקר. לדוגמה, נסתכל על נתונים מאחד המחקרים הגדולים הראשונים על תמותה הקשורה לעישון סיגריות. מחקר זה, שנערך על ידי Doll ו-,Hill עקב במשך שנים רבות אחרי רופאים בבריטניה, בגילאים 35 ומעלה בתחילת המחקר. להלן חלק מן התוצאות: תמותה (ל- 100,000) לפי קבוצות עישון -- מסרטן ריאות ממחלות לב מעשנים (5+ גרם ליום) לא מעשנים סיכון מוחלט סיכון יחסי כללית 1884 135 559 1.4 599 4 177 1.4 166 7 159 3.7 איפה רואים את בעיות הבריאות עקב עישון, במחלות לב או בסרטן ראיות? הסיכון המוחלט גבוה יותר עבור מחלות לב -- התוספת מעישון למספר הנפטרים כל שנה ממחלות לב גדולה מן התוספת מסרטן ריאות. מדד זה משקף חשיבות, למשל, מבחינת בריאות הציבור. הסיכון היחסי מצביע בצורה חד-משמעית על סרטן ריאות. מוות ממחלה זו נדירה מאוד אצל לא מעשנים, אבל עולה באופן חד אצל המעשנים. לכן, סיכון יחסי יותר קשור לשאלה האפידימיולוגית, האם הגורם בעל חשיבות בהסברת האתיולוגיה של המחלה.

דוגמה: במחקר על הליכה ובעיות לב, ביטאו את התוצאות במונחים של סיכון יחסי. החוקרים מצאו שהסיכון היחסי של קבוצת ההליכה המרבית לעומת אלה שלא הלכו היה 0.65. החוקרים הגדירו 5 קבוצות גם לפי מדד של שריפת אנרגיה אצל האחיות. הסיכונים היחסיים של כל אחת מ- 4 הקבוצות הגבוהות יותר לעומת הקבוצה הנמוכה היו 0.74 0.81, 0.88, ו- 0.66. הערה: היחסים הנ ל משקפים תיקון להבדלי גיל ומשתנים פרוגנוסטיים חשובים בין הקבוצות. מדד חשוב נוסף להשוואה בין שני שיעורים הוא יחס הסיכויים ratio),(odds המוגדר על ידי OR = [p 1 (1-p )]/[p (1-p 1 )]. אם = 1,OR פרוש הדבר ששיעורי התופעה בשתי הקבוצות שווים זה לזה. אם OR גדול מ- 1, שיעור גבוה יותר בקבוצה 1 ואם OR קטן מ- 1, השיעור גבוה יותר בקבוצה. דוגמה: המחקר על טיפוס גנטי בוורידים. קבוצה חולים ביקורת C677T) (MTHFR וקרישים Odds=p/(1-p) 1- p p 0.95 0.167 0.77 0.857 0.8 0.143 OR = 0.95/0.167 = 1.77 מסקנה: אנשים עם הטיפוס הגנטי עומדים בסכנה מוגברת לסבול מקרישים בוורידים.

למה OR עדיף על סיכון יחסי במחקר זה? נראה שהסיכון היחסי נותן מדד יותר ישיר להגברת הסיכון אצל אנשים עם הטיפוס הגנטי. אז אולי עדיף לחשב כאן את הסיכון היחסי. מדדי השואה וסוגי מחקר. להלן שלוש תוכניות מחקר אפשריות כדי לבדוק האם הגן של MTHFR הוא גורם סיכון לקרישי דם בוורידים: 1. מחקר חתך עם סיווג לפי MTHFR ובעיית קרישים.. מחקר הכולל מדגמים נפרדים לפי שני מצבי MTHFR ובודק האם יש בעיית קרישים. 3. מחקר מקרה-ביקורת כפי שבוצע. נניח שתמונת האוכלוסייה היא כך: סובל מ- VTE לא כן MTHFR 3% שלילי 84% 1% חיובי 1%

הצפי ממדגם חתך של 400 איש: סובל מ- VTE 1 4 336 48 MTHFR שלילי חיובי לא כן ניתן לאמוד את כל השיעורים, את הסיכון היחסי, ואת ה-.OR Relative Risk = (4/5)/(1/348) =.3. OR = (4/48)/(1/336) =.33. הצפי ממדגמים נפרדים לפי מצב MTHFR של 411 איש: סובל מ- VTE כן לא MTHFR 7 196 שלילי 16 19 חיובי ניתן לאמוד את כל השיעורים למעט השיעור הכולל של.VTE Relative Risk = (16/08)/(7/03) =.3. OR = (16/19)/(7/196) =.33. הצפי ממדגם של 400 איש במחקר מקרה-ביקורת: סובל מ- VTE 150 50 175 5 שלילי חיובי לא כן MTHFR אי אפשר לאמוד את השיעור של VTE באף קבוצה. Relative Risk =?. OR = (50/5)/(150/175) =.33.

ליחס הסיכויים יתרון חשוב -- ניתן לחשבו בכל מערך מחקר וגודלו אינו מושפע על ידי שיטת המחקר. במחלה נדירה, יחס הסיכויים די קרוב מספרית לסיכון היחסי. בדוגמא שלנו, הנחנו שהשכיחות של VTE היא 4% ומצאנו שהסיכון היחסי היה 3.37 ויחס הסיכויים 3.67. ככל שהשכיחות קטנה יותר, שני המדדים מתקרבים זה לזה. לכן, במחקר על מחלות נדירות, יחס הסיכויים יכול לשמש גם כאומדן לסיכון היחסי. יתרון של מחקר מקרה-ביקורת הוא ההבטחה של מספר לא מבוטל של חולים, במיוחד כאשר חוקרים מחלה נדירה. הסקה סטטיסט ית לשיעורים ופרופורציות דנו במחקר מקרה-ביקורת על הקשר בין אפיון גנטי (לגן (MTHFR ובעיות של קרישי דם. נתוני המחקר נראו כך: חולי VTE מספר נבדקים 16 מספר חיובי ל- MTHFR 37 אחוז חיובי ל- MTHFR.8 14.3 48 ביקורת 336 הנה מספר שאלות של החוקרים: 1. מה השיעור של הטיפוס הגנטי המיוחד בכל האוכלוסייה הבריאה? החולה ב-?VTE. האם שיעור הגן באוכלוסייה באמת שונה מ- 10%? 3. מהו ההפרש בין שני השיעורים? 4. האם ניתן להסיק בביטחון ששיעור הגן יותר גבוה אצל החולים? 5. מה ערכו האמיתי של יחס הסיכויים? נראה בהמשך איך לענות על כל השאלות.

1. מה השיעור ) ( של הטיפוס הגנטי המיוחד בכל האוכלוסייה הבריאה? החולה ב- ) VTE )? p p 1 נתחיל עם האוכלוסייה הבריאה. בקבוצת הביקורת, 48 מתוך 336 נבדקים היו חיוביים, פרופורציה מדגמית של = 0.143 1 ˆp. "הכובע" מסמן שמדובר באמדן מדגמי לתכונה של האוכלוסייה. האם השיעור הנצפה המדגמי יהיה שווה בדיוק לשיעור באוכלוסייה? סביר להניח שלא. לכן, חשוב להשקיע מחשבה מה מידת הטעות. לשם כך, נפעיל את התיאוריה של חוקי ההסתברות. לפי משפט הגבול המרכזי, ההפרש בין תשיעור במדגם pˆ 1 לבין. p 1 p )/ השיעור האמיתי p 1 מתפלג נורמלית עם סטיית תקן n אפשר לאמוד את סטיית התקן על ידי הצבת pˆ 1 בנוסחה. בדוגמה שלנו, נקבל סטיית תקן של במקום 1( 1 p 1 ( 0.143)(0.857) / 336 = 0.019 עכשיו ניתן להסיק מסקנות ברורות לגבי "מידת הפיספוס" באמידת השיעור באוכלוסייה. למשל, אנחנו יודעים, לפי העקומה הנורמלית סטנדרטית, שבהסתברות 95%, pˆ 1 p 1.96 0.019 = 0.037 1 שיעור הטיפוס הגנטי שקיבלנו במדגם היה = 0.143 1 pˆ. לכן, מאוד סביר שהשיעור האמיתי לא יותר קטן מ- = 0.106 0.037 0.143 ולא יותר גדול מ- = 0.180 0.037.0.143 + הרווח (0.106,0.180) נקרא רווח בר סמך ל- בלועזית: 95% confidence interval p 1 ברמת סמך 95%. רמת הסמך (או רמת הביטחון) נובעת מן הבחירה שלנו להתחיל את החישוב עם שטח של 95% מתחת לעקומה הנורמלית. ניתן היה לבחור שטח אחר ואז היינו משנים את רמת הסמך ואת "הכופל" הנשלף מן הטבלה הנורמלית. הבחירות הטיפוסיות הן רמות סמך של 95%, 99% ו- 90%.

מה המטרה ומה הפירוש של רווח בר סמך? רווח סמך מוסר לנו מידע על תכונה באוכלוסייה המעניינת אותנו. במקום למסור מספר בודד לתכונה, רווח הסמך מוסר טווח של ערכים המתאימים לתכונה לפי תוצאות המדגם. הסתכלות בטווח הזה מאפשרת לנו להעריך מהו הערך ובנוסף להתרשם האם המדגם מספק מידע מאוד מדויק או די מעורפל לגבי ערכו של התכונה. בדוגמה שלנו, המדגם הצליח לדייק עד כדי כך שבביטחון 95%, ניתן לקבוע שהשיעור האמיתי הוא בין 0.106 ו- 0.180. מה המטרה ומה הפירוש של רווח הסמך? רווח הסמך מקבל את פירושו מן השיקולים ההסתברותיים הקובעים את ההתפלגות של pˆ 1. אילו בחרנו מדגם חדש, היינו מקבלים שיעור מדגמי אחר וגם רווח סמך אחר. לפי התיאוריה, אם ניקח הרבה מדגמים ולכל אחד נחשב רווח סמך ברמת סמך 95%, נמצא ש- 95% מן הרווחים הם "מצליחים" במובן זה שהשיעור האמיתי אכן נמצא בין קצוות הרווח. הגרף מציג 5 רווחי סמך "טיפוסיים" כאשר השיעור האמיתי הוא 0.15. לשים לב שכל הרווחים "מצליחים", למעט מדגם 7. 5 CI's, True Rate = 0.15 Rate 0.05 0.10 0.15 0.0 0.5 0 5 10 15 0 5 Sample

מה השיעור האמיתי של הטיפוס הגנטי אצל חולי?VTE השיעור במדגם היה 0.8 מתוך 16 חולים. לכן סטיית התקן היא ( 0.8)(0.77) /16 = 0.033. לכן רווח בר סמך (ברמת סמך 95%) לשיעור האמיתי יהיה: 0.8-1.96(0.033) = 0.163 0.8 + 1.96(0.033) = 0.93. הרווח יותר רחב בקרב החולים כיוון שגודל המ דגם יותר קטן.. האם שיעור הטיפוס הגנטי באוכלוסייה באמת שונה מ- 10%? p 1 p 1 בקבוצת הביקורת, 48 מתוך 336 נבדקים היו חיוביים, פרופורציה מדגמית של = 0.143 1 pˆ. האם יתכן לקבל תוצאה כל כך גבוהה במדגם אם = 0.10? נניח לרגע ש- = 0.10 ונפעיל שוב את הרעיונות שפיתחנו בהסתברות. תחת ההנחה שלנו, אנחנו יודעים שההתפלגות של pˆ 1 צריכה להיות התפלגות נורמלית אם תוחלת 0.10 וסטיית תקן. ( 0.1)(0.9) / 336 = 0.0164 לכן, שוב תחת ההנחה של 10% באוכלוסייה, מתברר ש- Z = p 0.1 ˆ1 (.1)(.9) / 336 ~ N (0,1). נחשב את Z לנתונים שלנו ונבדוק האם התוצאה מן המדגם "תואמת" את הציפייה התיאורטית. מנתוני המדגם, Z = 0.143 0.1 (.1)(.9) / 336 =.6.

0.4 0.3 Prediction From Theory If p1=0.1. 0. Sample Result 0.1 0.0-3 - -1 0 1 3 התוצאה במדגם שלנו לא נראית אופיינית להתפלגות. נהוג למדוד עד כמה היא לא אופיינית על ידי חישוב השטח מתחת לעקומת ההתפלגות ועוד יותר קיצוני מ-.6. לשים לב שתוצאה של Z העולה על.6 תיראה יותר קיצונית אבל גם תוצאה נמוכה במיוחד, ובפרט פחות מ-.6-, תיראה יותר קיצונית נגד 0.10 מאשר זו של המדגם שלנו. לכן, נחשב את הסכום של השטח משמאל ל-.6- והשטח מימין ל-.6. ניתן לחשב את השטח משמאל ל-.6- ב- EXCEL על ידי =NORMDIST(-.6,0,1,TRUE) התשובה: 0.0044. לכן סכום השטחים = 0.0088. מסקנה: תוצאות המדגם לא נראות מתאימות להנחה ש- = 0.1 p ונותנות גיבוי לדחיית השערה זו. הסיכום הנפוץ בספרות הרפואית יהיה כך: ניתן לדחות את ההשערה ש- = 0.1 p ברמת מובהקות נצפית (או (p-value של 0.0088. 1

ההגדרה של רמת המובהקות הנצפית :(p-value) ההסתברות לקבל תוצאה מדגמית כמו זו של המדגם הנוכחי, או עוד יותר קיצוני מזו של המדגם, אם אכן ההשערה הנבדקת היא נכונה. לשים לב שככל שרמת המובהקות הנצפית קטנה יותר, יש עדות חזקה יותר נגד ההשערה הנבדקת. איך יתכן רמת מובהקות נצפית נמוכה? הסבר א': ההשערה בכל אופן נכונה אך קיבלנו תוצאות נדירות במדגם. הסבר ב': ההשערה איננה נכונה. רמת המובהקות הנצפית היא מדד ל"עד כמה נדיר" התוצאות של המדגם אם ההשערה הנבדקת נכונה. 3. מהו ההפרש (1 p ( בין שני השיעורים? p הגיוני לאמוד את הפרש השיעורים על ידי ההפרש במדגם pˆ p ˆ1 = 0.085 בדומה לדיון בשיעור בודד, חשוב לצרף הערכה של מידת ההבדל בין התוצאה המדגמית לבין הפרש השיעורים האמיתי. נעשה זאת על ידי חישוב רווח בר סמך להפרש השיעורים. ראינו שכל אחת מן הפרופורציות המדגמיות מתפלגת נורמלית. לכן ˆp, מתפלגת נורמלית. לכן, אם נצליח גם ההפרש שלהן, 1ˆp לאמוד את סטיית התקן של ההפרש, אפשר לחשב רווח בר סמך בדיוק כמו שעשינו במקרה של קבוצה בודדת. תזכורת: Var( pˆ pˆ ) = Var( pˆ ) + Var( pˆ ) 1 p(1 p) p1(1 p1) = + 16 336 1 נציב בנוסחה את השיעורים המדגמיים כדי לאמוד את השונות של ההפרש.

האומדן לשונות: האומדן לסטיית התקן: (.8)(.77) 16 +. 00145 = (.143)(.857) =.00145 336 0.038 רווח הסמך להפרש השיעורים ברמת סמך 95%: 0.085-1.96(0.038) = 0.010 0.085 + 1.96(0.038) = 0.160 4. האם ניתן להסיק בביטחון ששיעור הגן יותר גבוה אצל החולים? אפשר לערוך מבחן שמתבסס על ההתפלגות של למבחן הזה יש גרסה כמעט שקולה לגמרי, הנקראת מבחן בריבוע). גרסה זו היא הנפוצה בספרות הרפואית.. χ pˆ p ˆ1 (חי נתוני המחקר הראו ש-.8% מן החולים ב- VTE התגלו כחיוביים גנטית ל- MTHFR לעומת 14.3% מקבוצת הביקורת. החוקרים מעונינים לשכנע שמצב זה מצביע על כך שאכן לאנשים שהם חיוביים ל- MTHFR סיכון מוגבר לחלות ב-.VTE הסבר חלופי: אין כל הבדל אמיתי בין הקבוצות וההבדל הנצפה הוא מקרי בלבד. המבחן הסטטיסטי בודק האם, לאור הנתונים, ההסבר החלופי נראה בכלל סביר. אם כן, קשה לומר שיש עדות משכנעת שקיים סיכון מוגבר לאנשים שהם חיוביים ל-.MTHFR אם ניתן להפריך את ההסבר החלופי, החוקרים מחזקים את טענתם. נארגן את נתוני המחקר בטבלה הבאה: % חיובי שלילי חיובי קבוצה.8 15 37 VTE 14.3 88 48 ביקורת 17.1 413 85 סה כ

אם באמת אין הבדל בין הקבוצות, ניתן להעריך את שיעור החיוביים ל- MTHFR כ- 17.1%, בלי תלות בקבוצה. אם כן, כמה חיוביים היה צפוי לראות בקבוצת ה-?VTE התשובה ההגיונית היא 17.1% כפול 16, או 7.65 חיוביים. אפשר לחשב באותו אופן ערך מצופה לכל אחד מ- 4 התאים של הטבלה בשקף הקודם. נקבל את הטבלה הבאה: סה"כ שלילי חיובי קבוצה 16 134.35 7.65 VTE ביקורת סה כ 57.35 336 498 78.65 413 85 קרל פירסון Pearson) (Karl הציע שיטה לבדוק את ההשערה שאין הבדל תוך השואה בין שתי הטבלאות. נסמן ב- OBS i את הערך הנצפה בתא i של הטבלה וב- EXP i את הערך הצפוי. הסטטיסטי של פירסון הוא χ = ( OBS i EXP EXP i i ). הסכום רץ על כל התאים בטבלה. חישוב הסטטיסטי לנתונים על MTHFR ו- :VTE (15 134.35) (37 7.65) + 134.35 7.65 (88 78.65) (48 57.35) + + 78.65 57.35 = 5.65 מתי נשתכנע שההבדל הוא אמיתי ולא מקרי? אם הטבלה הנצפית שונה מספיק מן הטבלה הצפויה. כלומר, אם הסטטיסטי χ הוא גדול.

האם 5.65 מספיק גדול? כדי לענות, אנחנו צריכים לדעת מה היה צפוי אם, באמת, אין הבדל בין הקבוצות. התשובה אם אין הבדל, ההתפלגות של הסטטיסטי של פירסון היא מה שנקרא התפלגות חי בריבוע עם דרגת חופש אחת. האם תוצאות המחקר מפריכות את הטענה של הבדל מקרי בלבד? נסכם את חוזק התוצאות על ידי חישוב של ה-,p-value כלומר על ידי חישוב ההסתברות לקבל תוצאה של 5.65 או יותר מהתפלגות חי בריבוע עם דרגת חופש אחת. ניתן לבצע את החישוב ב- EXCEL על ידי =CHIDIST(5.65,1) התוצאה: = p-value.0.017 כלומר, רק 0.017 לקבל הבדל כל כך גדול. אם באמת אין הבדל, סיכוי של ניתן לבצע את הניתוח בקלות רבה ב-.SPSS בוחרים Analyze Descriptive Statistics Crosstabs ואז בוחרים את האופציה של סטטיסטיים. תחת אופציה זו, מסמנים את הקופסא של מבחני חי בריבוע. על מנת לקבל את האחוזים בכל תא, אפשר לבחור באופציה Cells ואז לסמן את הקופסאות של אחוזים. GROUP * MTHFR Crosstabulation GROUP Total 1.00.00 Count % within GROUP % within MTHFR % of Total Count % within GROUP % within MTHFR % of Total Count % within GROUP % within MTHFR % of Total MTHFR.00 1.00 Total 15 37 16 77.%.8% 100.0% 30.3% 43.5% 3.5% 5.1% 7.4% 3.5% 88 48 336 85.7% 14.3% 100.0% 69.7% 56.5% 67.5% 57.8% 9.6% 67.5% 413 85 498 8.9% 17.1% 100.0% 100.0% 100.0% 100.0% 8.9% 17.1% 100.0%

Pearson Chi-Squa Continuity Correct a Likelihood Ratio Fisher's Exact Tes Linear-by-Linear Association N of Valid Cases Chi-Square Tests Value df (-sided) 5.650 b 1.017 5.06 1.04 5.446 1.00 5.638 1.018 498 a. Computed only for a x table Asymp. Sig. Exact Sig. Exact Sig. (-sided) (1-sided).0.013 b. 0 cells (.0%) have expected count less than 5. The minimum expecte 7.65. מבחן חי בריבוע או רווח בר סמך?? ברוב המקרים, מעניין לבצע את שניהם. המבחן עונה על השאלה הספציפית, האם יתכן שההפרש במדגם הוא מקרי בלבד. רווח הסמך נותן תמונה מהו ההפרש האמיתי, תוך דגש על הדיוק בו ניתן לאמוד את ההפרש מן המדגם. לשים לב שיש גם הקבלה בין המבחן לבין רווח הסמך. העובדה שרווח הסמך ברמת סמך 95% להפרש השיעורים לא כלל 0 מקביל לכך שבמבחן היה "מובהק" עם p-value קטנה מ- 5%. 5. מה ערכו האמיתי של יחס הסיכויים? נזכור שיחס הסיכויים מוגדר על ידי OR = [p (1-p 1 )]/[p 1 (1-p )]. האומד הפשוט הטבעי של ה- OR מתקבל מהצבת השיעורים במדגם: [(.8)(.857)]/[(.143)(.77)] = 1.77. איך אפשר לחשב רווח סמך ל-?OR האומד ל- OR מורכב ממנות של ממוצעים ואין שום סיבה לצפות שביטוי כזה יתפלג נורמלית.

הפתרון מתקבל ממעבר לסקלה לוגריתמית. מתברר שהלוגריתם הטבעי של OR כן מתפלג, בקירוב, נורמלית. מרכז ההתפלגות הוא הלוגריתם של ה- OR האמיתי וניתן לאמוד את השונות על ידי כאשר,b,a בדוגמה שלנו נקבל כאומדן לשונות 1 + = 0.059355 48 1 1 1 1 + + +. a b c d c, ו- d הם הספירות בארבעת התאים של טבלת הנתונים. 1 15 + 1 37 + 1 88 וכאומדן לסטיית התקן = 0.44 059355. הלוגריתם של ה- OR המדגמי הוא ln(1.77) = 0.571 לכן רווח סמך ברמת סמך 95% ללוגריתם של OR יהיה 0.571-1.96(0.44) = 0.093 0.571 + 1.96(0.44) = 1.049 כדי לקבל רווח סמך ברמת סמך 95% ל-,OR נעביר את הגבולות חזרה לסקלה המקורית: exp(0.093) = 1.10 exp(1.049) =.85 תיקון למשתנים נוספים. האם תמיד ניתן להשוות בין שני שיעורים? לדוגמא, אם נשווה שיעורי תמותה אצל מעשנים ולא מעשנים, מה נמצא? למה? יש תמיד סכנה להשוות שיעורים כאשר קיימים גורמים נוספים ברקע העלולים לשבש את ההשוואה. גורמים כאלה נקראים.confounders שתי שיטות נפוצות לטפל בגורמים כאלה הן התנייה וסטנדרטיזציה. בהתנייה, קודם כל מחלקים את הנתונים לקבוצות בהן משתנה הרקע מקבל את אותו הערך. אז, מבצעים השוואה נפרדת של השיעורים בתוך כל קבוצה. יש מספר דרכים לאחד את התוצאות הנפרדות, למשל דרך רגרסיה לוגיסטית או מבחן.Mantel-Haenszel

Standardization מאמר בהארץ מסוף ינואר 001 פרסם שיעורי תמותה של פגים השיעורים היו מפורקים בהתאם למשקל בארץ, בארה"ב ובקנדה. הלידה של התינוק. להלן התוצאות (באחוזים): קנדה ארה"ב ישראל משקל 38 44 71 500-749 14 1 4 750-999 5 5.4 1.3 1000-149 4 3.4 3.4 150-1499 איך כדאי להשוות בין המדינות? אפשרות אחת להתבונן בכל הטבלה. אפשרי כאן, אבל זה הופך להיות מסורבל אם יש הרבה תאים טבלה. אפשרות אחרת לחשב לכל מדינה את סה"כ שיעור התמותה. אבל כאן יש בעיה השיעור בסה"כ תלוי לא רק בשיעורים בכל קבוצת משקל, אלא גם בכמה תינוקות יש בכל קבוצה. נדגים זאת על ידי הסתכלות בשתי התפלגויות היפוטטיות לצורך השואה בין ישראל לארה"ב. תיאור היפוטטי 1: ישראל ארה"ב משקל תינוקות תמותה תינוקות תמותה 44 10 71 1 749-1 4 0 999-5.4 30 1.3 8 149-3.4 38 3.4 40 1499-9.95 סה"כ 18.1 סה"כ

תיאור היפוטטי : ישראל ארה"ב משקל תינוקות תמותה תינוקות תמותה 44 10 71 749-1 4 13 999-5.4 30 1.3 5 149-3.4 38 3.4 60 1499-9.95 סה"כ 9.66 סה"כ בתיאור השני, התמונה מתהפכת! הסיבה ברורה: תיארנו מצב בו יש בארה"ב אחוז גבוה יותר של תינוקות בעלי "סיכון גבוה" כתוצאה ממשקל לידה נמוך. במקרה כזה, שיעור התמותה הפשוט אינו נותן השואה "הוגנת" בין שתי המדינות כי ההבדלים ביניהן מבחינת משקל בלידה בנויים לתוך השיעורים. במקום, ניתן להגדיר "חלוקה סטנדרטית" של התינוקות על פני קבוצות משקל ולחשב שיעורי תמותה "מתוקננים" בהתאם. בלועזית,.standardized rates להלן שיעורים סטנדרטים, על פי המשקלים האמריקאים: ישראל ארה"ב משקל תינוקות תמותה תמותה 44 71 10 749-1 4 999-5.4 1.3 30 149-3.4 3.4 38 1499-9.95 סה"כ 17.36